#导入模块
from bs4 import BeautifulSoup
#准备文档字符串
html='''<!DOCTYPE html>
<html>
<head>
    <title>简单测试页面</title>
</head>
<body>
    <h1>商品列表</h1>
    
    <div class="product">
        <h2 class="name">笔记本电脑</h2>
        <p class="price">¥5999</p>
        <p class="category">电子产品</p>
    </div>
    
    <div class="product">
        <h2 class="name">Python编程书</h2>
        <p class="price">¥89</p>
        <p class="category">图书</p>
    </div>
    
    <div class="product sale">
        <h2 class="name">无线鼠标</h2>
        <p class="price">¥129 <span class="old-price">¥199</span></p>
        <p class="category">电子产品</p>
    </div>

    <table border="1">
        <tr>
            <th>商品</th>
            <th>库存</th>
        </tr>
        <tr>
            <td>笔记本电脑</td>
            <td>15</td>
        </tr>
        <tr>
            <td>Python编程书</td>
            <td>32</td>
        </tr>
    </table>
    
    <div class="pagination">
        <a href="/page1">上一页</a>
        <a href="/page2">1</a>
        <a href="/page3">2</a>
        <a href="/page4">下一页</a>
    </div>
</body>
</html>'''
#创建对象
soup=BeautifulSoup(html,"lxml")
#查找title标签
title=soup.find('title')
print(title)
#查找a标签
a=soup.find('a')
print(a)
#查找所有的a标签
a_s=soup.find_all('a')
print(a_s)
#根据属性查找
#方式一：命名参数指定
link1=soup.find(id="name")
print(link1)
#方式二：attrs指定属性字典,更推荐这个方法
link1_2 =soup.find(attrs={"id":"name"})
print(link1_2)
#查找文本
text=soup.find(text="Python编程书")
print(text)
#tag对象
print(type(a))
#标签名
print("标签名>",a.name)
print("标签属性>",a.attrs)
print("标签文本内容>",a.text)